en écologie numérique
Montpellier le 28-11-2022
Galileo Galilei, par Peter Paul Rubens (circa 1630)
Mosaïque de Jupiter en vraies couleurs réalisée à partir de photographies prises par la sonde Cassini le 29 décembre 2000 à 5 h 30 UTC.
Lunette de Galillée (1610)
Les quatre satellites galilléens :
Deux pages (scan) du ‘Sidereus Nuncius’ de Galillée (“The Starry Messenger” or “The Herald of the Stars”), Venice, 1610.
Goodman et al. (2014)
PLoS Comput Biol
Galillée relate une expérience scientifique au bout de laquelle on abouti à la conclusion que Io, Europe, Ganymède et Callisto sont en orbite autour de Jupiter.
Les notes de Galillée intègrent:
Données (dessins)
Méta-données (date, météo, carac. lunette)
Texte (description des méthodes, analyses et conclusions)
données
méta-données
mat. & mét.
Recherche Reproductible
les revues le demandent (data accessibility, open research)
si je garde mes données et mon code, j’ai un avantage compétitif
vous êtes jeunes (au moins dans votre tête), c’est à vous de changer le monde !
pour ça il faut apprendre à coder un minimum …
depuis Galillée le concept a un peu évolué …
Un article publié n’est que le sommet de l’iceberg que représente le processus de recherche …
“An article about computational results is advertising, not scholarship. The actual scholarship is the full software environment, code and data, that produced the result.”
Claerbout and Karrenbach 1992.
“[…] reproducible computational research is to expose more of the research workflow to our audience.”
https://ropensci.github.io/reproducibility-guide/sections/introduction/
Data Management
Software
Tracking Changes
Collaboration
Project Organization
Manuscripts
Wilson et al. 2016. Plos Comp Biol. https://arxiv.org/pdf/1609.00037.pdf
Saving both raw and intermediate forms; documenting all steps; creating tidy data amenable to analysis.
Writing, organizing, and sharing scripts and programs used in an analysis.
Le code, les scripts
L’environnement logiciel
Le “workflow” (enchaînement des scripts, des logiciels).
Le “workflow” (enchaînement des scripts, des logiciels).
Archiver l’évolution de divers composants de notre projet.
Utiliser un logiciel de gestion de versions (Git).
Faciliter la compréhension des projets de recherche : permettre la contribution, la vérification, la synthèse et la progression.
Organizing the digital artifacts of a project to ease discovery and understanding.
Research compendium : organisation du répertoire de travail
Writing manuscripts in a way that leaves an audit trail and minimizes manual merging of conflict.
Utiliser la programmation lettrée (literate programming)
Au lieu de considérer que notre tâche principale est de dire à un ordinateur ce qu’il doit faire, appliquons-nous plutôt à expliquer à des êtres humains ce que nous voulons que l’ordinateur fasse.
Donald Knuth, années 70
Quarto (https://quarto.org) / Rmarkdown (…)
Comment ça marche Quarto ?
En markdown le texte est formaté en utilisant des balises très simples comme les _ ou les *
Formats d’export de Quarto (pandoc)